The Quranic Arabic Corpus

提供者:朱述承

简介

古兰经阿拉伯语语料库涵盖了带注释的语料资源,它显示了古兰经中每个词的阿拉伯语语法,句法和形态。语料库提供了三个层次的分析:词法注释,句法树库和语义本体。树库是汇集句法树的语言资源。这些是人工和计算机可以读取的句子的人工注释分析,不同的树库采用不同的语法理论。最近的阿拉伯语计算研究侧重于现代标准阿拉伯语,而古兰经的古典阿拉伯语则相对尚未探索。尽管数个世纪以来有关于这个主题的许多着作,但几乎没有人注意到传统的阿拉伯语语法特征。该网站的语法部分为希望贡献力量的注释者提供了一套指导方针。所使用的语法方法是传统的阿拉伯语语法,称为i’rāb(إعراب)。这是研究阿拉伯文句法的自然方法,并且在阿拉伯语言学方面已有1000多年的历史。

访问地址

http://corpus.quran.com

独特性

古兰经阿拉伯语语料库在三个重要方面与其他阿拉伯语树库不同:

源文本是阿拉伯语的一种不同形式。古兰经的语言被认为是古典阿拉伯语,不同于今天使用的现代标准阿拉伯语。作为一个中央宗教文本,古兰经也与其他阿拉伯树库中注释的报纸文章类型不同。鉴于古兰经对全世界伊斯兰教的重要性,在注释文本以确保公认的历史准确性时需要特别注意,因为语法分析可能意味着有其他的意义。幸运的是,有许多书籍使用传统的语法提供阿拉伯语古兰经的完整语法分析,鼓励注释者使用它来验证他们的注释。

该文本包含变音符号并被元音化。 “古兰经”的阿拉伯文本包含明确的变音符号,因此完全属于音位。现代标准的阿拉伯语是不带变音符号的,所以读者推断变位,而不是作为正字法的一部分。变音符号首次引入古兰经的阿拉伯语,以减少任何可能的含义模糊,并保持口头传统。这简化了文本的形态和句法分析。

使用i’rāb(إعراب)的传统语法。用于注释古兰经语法的语法框架是传统的阿拉伯语语法,用图形表示使用依赖关系图。所用的注释和术语完全符合古兰经现有的历史语法分析。这与遵循不同语法框架的其他阿拉伯语树库形成鲜明对比。